Row

Carga y Preparación de los Datos

Realizado por

  • Cristhian Castillo
  • Kevin Zarama

Para el análisis de los factores que influyen en el desempeño en un curso de matemáticas se cuenta con un conjunto de datos de 357 registros y 13 variables. Este conjunto contiene la información del seguimiento que un colegio realizó a sus estudiantes en el último año.

El conjunto de datos se entrega limpio, solo es necesario realizar modificaciones en los tipos de datos de las variables Medu, Fedu y traveltime que tienen tipo númerico y es necesario pasarlas a factor, también se pasan las variables de ingles a español para un mejor entendimiento. Adiccionalmente se le agrega la columna de aprobado para saber si el usuario está aprobado o no.

Una vez realizado estos cambios, se tiene que las variables son:

  • sex: Sexo del estudiante.

    • Femenino.
    • Masculino.
  • age: Edad del estudiante, los valores van del 15 al 22.

  • address: Tipo de residencia.

    • Rural.
    • Urbano.
  • Pstatus: - Estado de Convivencia de los padres.

    • Viviendo Juntos.
    • Apartados.
  • Medu: Nivel de Educación de la madre.

    • Ninguna o Educación primaría (4th Grado).
    • 5th a 9th grado.
    • Educación Secundaría.
    • Educación más alta.
  • Fedu: Nivel de educación del padre.

    • Ninguna o Educación primaría (4th Grado).
    • 5th a 9th grado.
    • Educación Secundaría.
    • Educación más alta.
  • reason: Razón para escoger la escuela.

    • Cerca de casa.
    • Reputación del colegio.
    • Curso de Preferencia.
    • Otra.
  • traveltime: Tiempo que toma ir de la casa a la escuela.

    • Bajo: Menor a 15 min.
    • Moderado: - 15 to 30 min.
    • Alto: Mayor a 30 min.
  • paid: clases extras pagadas en la asignatura de matematicas.

    • Si.
    • No.
  • internet: Acceso a internet en el hogar.

    • Si.
    • No.
  • absences: Número de faltas al colegio.

    • Baja: 0 a 5 faltas.
    • Media: 6 a 10 faltas.
    • Alta: 11 a 20 faltas.
    • Muy Alta: más de 20 faltas.
  • G3: Nota Final (Va desde 0 a 20)

  • Aprobado: Si es estudiante aprobó o no la asignatura.

    • Aprobado (Nota final mayor a 12).
    • Reprobado (Nota final mayor o igual a 12).

Análisis Univariado

Análisis sobre el sexo de los estudiantes

La distribución de hombres y mujeres dentro del conjunto de datos es bastante equilibrada habiendo ligeramente (13) más mujeres que hombres.

Análisis sobre la edad de los estudiantes

Al rededor del 70% de los estudiantes tienen una edad entre los 16 a 18 años. Algo que también es importante de este conjunto de datos es que hay 76 estudiantes con 15 años en el último año del colegio que es algo interesante de este conjunto de datos.

Análisis sobre el tipo de residencia de los estudiantes

El 78% de los estudiantes viven en residencias de tipo urbano donde solo el 22% lo hacen en rural. Por lo que es muy probable que el colegio sea un colegio dentro de alguna urbe y no un colegio rural.

Análisis sobre el estado de convivencia de los padres

El 89% de los padres de los estudiantes viven juntos, por lo que son familias que posiblemente son más estables y que podrían contribuir en el rendimiento de los estudiantes.

Análisis sobre el nivel de educación de la madre

Más de 35% de las madres tienen una educación más alta que educación secundaría, sin embargo la gran mayoría de la población, el 65% restante tiene una educación menor o igual a la secundaría y casi un 15% tan solo tiene educación primaría o no tiene educación. Estos datos pueden ser una imagen de la penetración de la educación en tiempos anteriores.

Análisis sobre el nivel de educación del padre

Análisis sobre la razón para escoger la escuela

Análisis sobre el tiempo tomado para ir a la escuela

Análisis sobre el pago de clases de matemáticas extra a los estudiantes

Análisis sobre el acceso a internet en el hogar

Análisis sobre las faltas al colegio

Análisis sobre la nota final

Análisis sobre los aprobados

Este es un dato bastante preocupante, puesto que el 63% de los estudiantes no aprobaron el curso de matemáticas, es decir que no obtuvieron el resultado minimo esperado por la institución para poder graduarse.

Análisis Bivariado

Género vs Nota final

Comparación de Generos y nota final, se puede observar que la nota final es un poco más alta en personas de género masculino que en personas de género femenino.

Edad vs Nota final

Comparación de la edad y la nota final, se puede observar que la nota final es mas baja en edades mayores y que en edades menores la nota final es mayor, tal como se muestra en la grafica.

Tipo de dirección de la casa vs Nota final

Comparación del tipo de dirección de la casa en la que viven los estudiantes y la nota final, en la grafica se puede observar que los estudiantes de tipo de dirección urbana es más alto que los estudiantes de dirección rural.

#### Estado de convivencia de los padres vs Nota final

Comparación de el estado de convivencia de los padres con la nota final, se puede observar que no existe mucha diferencia entre el estado de convivencia de los padres y la nota final.

Educación de la madre vs Nota final

Comparación de el nivel de educación de la madre y la nota final, se puede observar que la nota del examen de los estudiantes es un poco mas alta en cuanto sea el nivel de educación de la madre.

Educación del padre vs Nota final

Comparación de el nivel de educación del padre y la nota final, se puede observar que la nota del examen de los estudiantes no es tan notoria como en el caso del nivel de educacion de la madre, pero sigue el mismo patrón, aumentando la puntuación de el examen de los estudiantes a medida de que el nivel de educación del padre aumenta.

Razon de eleccion de la escuela vs Nota final

Razón de la elección de la escuela vs la nota final del examen, en esta comparación no se nota una diferencia muy notoria en los resultados de examenes de los estudiantes.

Viaje de la casa al colegio vs Nota final

Comparación del tiempo de viaje que los estudiantes desde su casa hasta el colegio, se puede observar que no existe una diferencia muy notoria entre el resultado que obtuvieron los estudiantes y el tiempo de viaje de los estudiantes desde su casa hasta el colegio.

Clases extra pagadas dentro de la asignatura vs Nota final

Comparación de clases extra pagadas dentro de la asignatura de matematicas por parte de los estudiantes y la nota final, los resultados de los estudiantes no difieren mucho en comparacion con que si el estudiante paga clases extra pagadas dentro de la asignatura o no lo pagan.

Acceso a internet en la casa vs Nota final

Acceso a internet en la casa de los estudiantes vs la nota final que el estudiante obtuvo en el examen, se puede observar que existe una leve diferencia a favor de los estudiantes que tienen acceso a internet con respecto a los estudiantes que no tienen acceso a internet en la casa.

Número de ausencias escolares vs Nota final

En la comparación de el número de ausencias escolares y la nota final del examen se puede observar que hay una relacion en los estudiantes que tienen pocas faltas y los estudiantes que tienen nota alta en el examen.

Análisis Multivariado

Puntaje final vs Edades vs Género de los estudiantes

Se puede observar que en la grafica no hay mucha diferencia entre las variables seleccionadas, tales como que no hay mucha diferencia entre géneros, edades y puntajes de los estudiantes.

Bono

Hacer el análisis bivariado con al menos 3 variables explicativas, pero siendo la variable objetivo la tasa de aprobación (aprobar es nota mayor a 12).

En la comparación que si los estudiantes tienen internet en casa y la tasa de aprovación se puede observar que hay una diferencia considerable, teniendo mayor tasa de aprobación los estudiantes que si tienen internet en casa en relación a los estudiantes que no tienen internet en casa.

Comparacion de las edades de los estudiantes y la tasa de aprobación de los estudiantes, se puede ver que la tasa de aprobación va bajando a medida de que las edades de los estudiantes aumentan, con excepción de los estudiantes que tienen 20 años, los cuales presentan la tasa de aprobacion más alta de todos los estudiantes.

Comparación de la tasa de aprobación de los estudiantes y la ausencia de los estudiantes a las clases, se observa que la tasa de aprobación va bajando a medida de que las ausencias aumentan.

Conclusiones

- Como conclusión del estudio de las variables y de las comparaciones de las variables provistas para la investigación del ICFES para la revisión de los factores de éxito en el desempeño en un curso de matemáticas de estudiantes de bachillerato, obtuvimos que la variable que mas influye en la aprobacion de los estudiantes es el número de ausencias a clases, por lo cual se deberia evitar la ausencia por parte de los estudiantes a las clases para que asi tengan más oportunidades de sacar una mayor nota en la asignatura.

- Otra de las variables que más afecta los resultados de la prueba es que si los estudiantes tienen internet en casa, haciendo que los estudiantes que si tienen internet en casa tengan un mayor resultado y una mayor tasa de aprobación que los estudiantes que no tienen internet en casa.

- Tambien otra de las variables que más afecta los resultados es la edad de los estudiantes, siendo que entre más jovenes tengan una mayor tasa de aprobación y un mayor resultado, con excepción de los estudiantes que tienen 20 años.

- Las otras variables que se presentan no tienen una influencia tan importante sobre los resultados de la nota final en la asignatura como las anteriormente mencionadas.